2018年07月20日
本日の内容
- 効率的で綺麗な可視化(60~90分程度)
- 整然データ(tidy data)とは?(復習)
- 可視化の重要性
- ggplot2とは?
- ggplot2の基本
- 復習のためのリソース
- 演習1~5(残り)
効率的で綺麗な可視化
【復習】整然データとは?
- 整然データ(tidy data)とはデータハンドリングを習得する上で知っておくべき概念
- Rで最も使うデータ・フレーム型は整然データにしておくべき
- 雑然データへの変換は簡単
- 整然データなら可視化(見える化)も簡単
可視化の重要性
- 下の散布図は全て同じ統計量!
- 数字を眺めてるだけでは判断を間違う可能性がある
- 分析の最初には必ずデータの分布を確認する癖をつける
